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Интенсиональные представления в виде 
нечеткой гибридной модели знаний 


Рассматривается проблема представления знаний, содержащихся в естественно-языковых текстах. 
Сформулирована проблема В общем виде и выдвинуты гипотезы на основе существующей концепции 
знаний. С учетом специфики человеческого мышления разработана гибридная модель представления 
знаний, состояние которой позволяет представлять знания, выраженные фрагментом текстовой информации. 
На основе модели прототипов решается задача учета индивидуальных знаний об окружении. 


Информатизация жизнедеятельности человека сопровождается ростом цифровой 
информации и соответственно развитием систем и методов работы с ней. Особенно 
актуальны направления в области интеллектуальных систем и автоматизации процессов. 

Одним из основных средств обмена информацией, в том числе и цифровой, между 
людьми является текст. Текст представляет собой связную, компактную, воспроизво- 
димую последовательность знаков, выражающую некоторое содержание и обладающую 
смыслом. Принципиальной особенностью задач анализа текстовой информации явля- 
ется то, что предметом анализа выступают знания о предметной области, содержащиеся в 
текстовой информации. Иными словами, для интеллектуальных систем интерпретации 
текстовой информации необходимы средства для представления знаний, содержа- 
щихся в этом тексте. 

Проблема понимания языковых сообщений не нова для современной науки. 
Решение этой проблемы лежит на стыке области искусственного интеллекта (ИИ), ког- 
нитивной психологи и лингвистики. Существуют подходы к решению данной задачи, 
которые описаны в работах А.Н. Хомского (теория трансформационных грамматик, 
теория следов), Д.А. Поспелова (представления знаний и рассуждения), Т. Винограда 
(вопросно-ответные системы, лингвистические процессоры), Р. Шенка (ТКЗ), М. Минского 
(теория фреймов), В.Н. Вагина (дедукция и вывод на сетях) и других ученых в области 
ИИ. В когнитивной психологии широко известны работы Дж. Андерсона, Р. Солсо, 
М.А. Холодной и др. 

Проблема понимания естественно-языковой (ЕЯ) информации решается с помощью 
перевода внешнего представления на ЕЯ в некую внутреннюю структуру, описываю- 
щую систему знаний. 

По мере развития исследований в области интеллектуальных систем возникла 
концепция знаний. Со временем сформировавшиеся модели представления знаний и 
данных сливались, убирая чёткую грань между данными и знаниями. В развитых мо- 
делях представления знаний можно выделить 2 компоненты [1]: интенсиональные 
представления и экстенсиональные представления. 

Экстенсиональные представления относятся к данным. С точки зрения моделей 
представления текстовой информации, экстенсиональной компонентой является обра- 
батываемый текст. 
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Интенсиональные представления относятся к знаниям о предметной области. 
Интенсиональная компонента есть концептуальная модель представления знаний. Под 
концептуальной моделью понимается концепция знаний о данной области, постро- 
енная инженером по знаниям. 

Автором строится гипотеза что знания, которые выражены фрагментом ЕЯ текста, 
могут быть представлены фрагментом концептуальной модели. Гипотезу можно сфор- 
мулировать следующим образом: заданному экстенсиональному отношению, опреде- 
лённому как протоструктура фрагмента текста, соответствует своё интенсиональное 
отношение. Это главная идея, положенная в основу работы. 

На основе анализа рассмотренных подходов в качестве интенсионального пред- 
ставления в работе предлагается гибридная нечеткая модель знаний. 


Гибридная модель представления знаний 


Структура гибридной модели (ГМ) разработана на основе комплексного подхо- 
да к решению поставленной задачи. Анализ когнитивного подхода позволил выделить 
базовые единицы модели: объекты, действия и события [2]. Элементы модели объе- 
диняются в классификационные структуры: семантические и пропозициональные 
сети [3], [4]. В модели учтены особенности индивидуального восприятия окружающего 
мира, представленные набором индивидуальных знаний о мире в виде прототипов гибр- 
дной модели. Прототипы формируются в соответствии с классификационными струк- 
турами и разделяются на схемы и скрипты [2], [4]. Таким образом, множество элементов 
модели и связи между ними представляют систему знаний. 

В основе модели лежит формальная система вида: 


ГМ =< ©} {0}, $} м, № >. (1) 


Множества {О}, {О} и {$3} есть множества базовых элементов, соответственно, 
множества объектов, действий и событий. №1 есть классификационная структура 
(семантическая сеть), отражающая взаимодействия информационных единиц множеств 
объектов и действий. №2 есть пропозициональная сеть, отражающая связи элементов 
множества событий. Таким образом, будем считать предложенную ГМ интенсио- 
нальным представлением системы интерпретации текстовой информации. Каждое 
слово текста отражает какое-то понятие, представляемое в концептуальной схеме симво- 
лом, либо его часть. Слово, или набор слов, описывающее конкретное понятие (сущ- 
ность), названо термином. В предлагаемой модели понятия (термины) названы 
объектами. 

Под объектом понимается модель сущности некоторого реального мира, которая 
обладает неким набором свойств. Для полноценного понимания окружения необхо- 
димо определить множество объектов рассматриваемой модели мира [5], то есть 
выделить предметную область. Каждый объект мировой модели может быть описан 
другими более элементарными объектами, а те, в свою очередь, другими и т.д. 

Согласно введенному определению, объектом в концептуальной модели будем 
считать именованную сущность и соответствующее ей множество признаков. Фор- 
мально запись объекта аналогична сетевой модели фрейма [1]: 


О =< Тр >, (2) 


где Т,- имя объекта, р; —1-й атрибут объекта. 
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Отметим, что в ГМ возможно наличие различных объектов при одинаковом 
наборе атрибутов у них. Их отличие может быть только в имени. Возникновение такой 
ситуации природно для человеческого восприятия. К этому может привести недоста- 
точное знание предметной области либо абстрагирование объектов с выделением 
только общих признаков. 

Текст (или языковое общение), кроме рассматриваемых объектов реального 
мира, несет еще информацию и об отношениях между ними. В языковой грамматике 
такие отношения названы глаголами. Отношения между понятиями на концептуаль- 
ном уровне названы действиями. За основу в определении действий была взята 
теория Р. Шенка, предложенная в работе [2]. 

По аналогии с объектами действия могут быть описаны через другие действия — 
более элементарные, а те, в свою очередь, через другие. Согласно теории концептуальной 
зависимости (ТКЗ) используется класс элементарных действий, названных АКТами [2]. 

Таким образом, действие какой-либо концептуализации есть, в сущности, имя, 
под которым объединяется множество последовательных действий, рассматриваемых 
как его часть. Эти инструментальные концептуализации не связаны причинно, по- 
скольку они реально неотделимы друг от друга. Они в действительности выражают 
одно действие и, таким образом, рассматриваются как часть концептуализации. 

Формально в работе действие концептуальной модели представлено именем и 
набором соответствующих ему АКТов: 


Пе Та Ре (3) 


где Г, — наименование действия, р. — АКТ, составляющий часть действия (признак 
Ур) 7 


действия). 

Событием названо некоторое действие, описывающее конкретные отношения 
конкретных объектов. В терминах предложенной модели событие есть множество, 
состоящее из действия и объектов, а также ряда прочих (вспомогательных) аргументов, 
которые могут выступать объектами или субъектами действия в элементарных АКТах. 
К вспомогательным аргументам относятся данные, при необходимости, дополни- 
тельно описывающие ситуацию: место, время, «инструменты» и так далее. 

Итак, делается заключение, что одна концептуализация действия рассматрива- 
ется как представитель одного события. 

В общем виде событие описывается как упорядоченный набор 5: 


5 =< ОО еты (4) 


где О,,О,- объект и субъект действия (15 )]) (2), р - действие (3), с, — дополни- 
тельный аргумент события. 

Порядок объекта и субъекта действия устанавливается однозначно. 

В силу того, что существуют возвратные глаголы, в которых реципиентом высту- 
пает сам субъект действия, вводится вспомогательный объект «15». Использование 
вспомогательного объекта возможно только для заданного множества действий. 

Описанные элементы гибридной модели, объекты и действия, образуют единое 
пространство -— знание о предметной области. Для удобного и корректного использо- 
вания элементы этого пространства нуждаются в структурировании. На основе обзора 
существующих моделей представления семантических структур, а также с учётом пред- 
ставлений объектов и действий в ГМ, в качестве базовой классификационной структуры 
элементов ГМ выбрана модель сравнительных семантических признаков. 
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Элементы ГМ, объединённые в семантические сети (объекты и действия), 
определены как рабочие элементы гибридной модели (РЭГМ). 

Семантические сети позволяют выделить все понятия в рамках предметной 
области и отношения между этими понятиями, а также структурировать их (разбить 
на составляющие и установить между всеми составляющими именованные связи). 

В работе сети представлены подграфами вида: 


МА, (5) 
где Г- множество узлов сетей (РЭГМ), 4 — множество дуг сетей. 


Согласно выбранной модели сравнительных семантических признаков элементы 
сети (5) запишутся как (6) и (7). 


У; =< РН Ра Пы, { Ра 6 >, Уу, = Р = 1, п (6) 
где У; — Г-й узел сети, Т- имя узла семантической сети, Ри — определяющий приз- 


нак узла, В, — характерный признак узла, 4 — число определяющих признаков узла, 


т — число характерных признаков узла. 
а (7) 


где И — заданный тип связей в семантической сети. 


В терминах рассматриваемой модели в качестве узлов семантических сетей 
будет выступать множество объектов (2) или действий (3): 


У = {О}, или У =}. 


В предложенной ГМ на семантических сетях введено два типа связей: 
а Арье 1 Ю А ре 2» 


где Аа — связи в сети типа «рай_оф›, М — связи в сети типа «1$_а». 


Для представления знаний, содержащихся в каждом отдельном предложении, 
используется пропозициональная репрезентация. Пропозициональный анализ представ- 
ляет в памяти сложные предложения в виде простых, которые выступают абстрактными 
пропозициональными единицами, или эпизодами. Пропозициональная информация 
может быть представлена в сетях, которые показывают отношения между понятиями. 

Эпизоды — это события ГМ, которые объединены пропозициональными связями. 
Различаются три пропозициональных связи: отношение «затем», ведущее к новому 
событию, отношение «во время» (или в то время как), позволяющее соединять теку- 
щие события с новым событием, и отношение «время», позволяющее соединять со- 
бытия с неопределенным временным порядком. Эпизоды являются узлами пропози- 
циональной сети. Таким образом, пропозициональная сеть есть множество событий с 
заданными пропозициональными связями между его элементами. Пропозициональ- 
ная сеть описана в гибридной модели подграфом вида: 


М(®, В), 
где О — множество узлов сети, В — множество дуг (пропозициональные связи). 
Множество пропозициональных связей может быть записано как: 


В = В де (1 В» О В те 2 
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где В — множество дуг пропозициональной сети, помеченных связью «затем», 


айег 


В„„, — множество связей «во время», Ви — множество связей «время». 


по 

Интенсиональные отношения в ГМ представлены прототипами. 

Прототип — это обобщенное представление, в котором воспроизведен набор 
общих и детализированных признаков типичного объекта (или действия) и которое 
выступает в качестве основы для идентификации любого нового понятия [6]. Про- 
тотипом в ГМ принято называть любой элемент модели (объект, действие, событие), 
который обладает набором собственных атрибутов, доступных к изменению под заданное 
окружение. В работе определено два типа прототипов: схемы и скрипты. 

Схемой названа абстракция объектов или репрезентация семантической сети 
объектов в терминах конкретного окружающего мира. Наличие и типы связей между 
объектами в сети зависят от модели окружающего мира. Схема отражает текущее 
представление заданного окружающего мира. Схемой назван подграф М’, представ- 
ленный в виде №’ (У', А’), где У’ — множество узлов сетей, элементы которого пред- 
ставлены в виде (2) и (3), А’— множество дуг сетей (А'< В(А) ). 

Отличие одной модели мира от другой представлено количеством признаков в 
соответствующих узлах сети (значения п и т в формулах (2) и (3)), а также их составом. 

Скрипты — репрезентация схемы, предложенная Шенком и Абельсоном для 
понятий, описывающих события [2]. В терминах предлагаемой ГМ скриптом названа 
репрезентация пропозициональной сети в терминах конкретного окружающего мира. 
Скриптом назван подграф М”, представленный в виде М” (И, В’) ‚ где О — множество 
узлов сети или пропозиций, В’ — подмножество возможных связей из универсума дуг 
пропозициональной сети ( В’ < К(В) ). 

Таким образом, скрипт задает только наличие и типы связей в сети. 

С учетом введенного понятия прототипа рассматриваемая гибридная модель в 
конкретной реализации представляет собой семантические и пропозициональные 
сети прототипов. Это свойство модели демонстрирует особенность восприятия мира 
человеком в зависимости от его познаний. 


Нечеткая гибридная модель 


Предложенная и описанная выше ГМ представления знаний в виде множества 
прототипов (схем и скриптов) является интенсиональным представлением уникаль- 
ных знаний о некоторой предметной области. Но данное представление не может быть 
полным, потому что человеческое мышление представляет собой нечёткий механизм [7]. 
Таким образом, полная модель знаний должна быть представлена нечеткой ГМ 
(НГМ), которая задана системой вида 


НГМ = <ГМ, {СЕ}>, 


где каждой составляющей ГМ из (1) приписывается фактор уверенности (СЕ). 
Фактор уверенности для множеств объектов и действий, обозначенных в работе 
как РГЭМ, заложен в природе этих элементов. Исходя из (2) и (3) РЭГМ есть набор 
признаков, формируемый из множества всех возможных признаков при построении 
интенсиональной части модели. Для каждого интенсионального представления зада- 
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ется разная степень принадлежности определённого признака конкретному понятию. 
Это даёт возможность определить каждый РЭГМ как подмножество признаков, об- 
ладающее нечеткой характеристикой: 


Т =Кр, [мтФ/))} , (8) 


РИ 
М = {0, е,2е...,1} , 


где М‚(р,) — функция принадлежности признака узлу Т, р, -— признак РЭГМ, Р — 


— 


множество всех признаков, М — множество возможных значений функции принад- 
лежностей. 

Фактор уверенности для элементов множества событий задаётся уверенностью 
в составляющих этого события. Согласно (4) событие состоит из элементов мно- 
жеств объектов и действий, а также дополнительных аргументов, которые влияют на 
отношения между событиями, но не являются составляющими уверенности в самом 
событии. 

Таким образом, если в качестве элементов события принять РЭГМ, описанные 
в (8), то событие определяется как множество нечётких подмножеств. 


И Г (9) 


где Т°,Т° — узлы семантической сети объектов (объект и субъект), Т^ — узел семан- 


тической сети действий. 
Фактор уверенности классификационных структур НГМ есть множество нечётких 
характеристик связей в этих структурах. Соответственно, семантические сети, описан- 


ныев (5), будут представлены в виде нечёткого графа А [7] 
А = {а, |ф(а, }, 
У(у у, ЕГХР : 4 (%,у,) ЕМ, 
ф(а,) = Иду, ), 
М = 0. = 2..1 
где у1, у/ — узлы семантической сети, ай — дуга из узла у в узел у}, И(у,,у,) ИЛИ 
ф(а,) — функция принадлежности дуги ай данной сети, или сила связи узлов Ури у] 
(ф(а,) Е [0.1] ), М — множество принадлежностей элементов множества Г хГ. 
С учётом формулы (8) множество узлов семантической сети А будет представ- 


лено как множество нечётких подмножеств 
ит}. 


Аналогичным образом нечёткое подмножество В, такое, что 
У (ии, ) ЕС ХЦ : Ив(ирьи,) ЕМ, 


М = {0, =,25....Д\, 


задаёт нечёткий граф пропозициональной сети. 
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Соответственно, Ф(Б,) определяет силу связи узлов в данной пропозициональ- 
ной сети. А сами узлы с учётом (9) будут определены как 
где 5, — событие, или эпизод пропозициональной сети. 


Построенная с учётом заданных факторов уверенности НГМ описывает инди- 
видуальные знания о предметной области и формирует новые интенсиональные 
отношения. 


Выводы 


Исследуемая в работе проблема представления знаний сформулирована в виде 
гипотез на основе существующей концепции знаний. С учетом возможных интенсио- 
нальных представлений разработана гибридная модель знаний, состояние которой 
позволяет представлять знания, выраженные фрагментом текстовой информации. 
В работе показано, что необходимо учитывать индивидуальные знания об окружении. 
В качестве решения этой задачи предлагается модель прототипов. Но данное пред- 
ставление не может быть полным, потому что человеческое мышление представляет 
собой нечёткий механизм. Таким образом, полная модель знаний, или интенсиональное 
представление, в работе описана в виде нечеткой гибридной модели знаний. 


Литература 


1. Искусственный интеллект: В 3 кн. / Под. Ред. Д.А. Поспелова. — М.: Радио и связь, 1990. — Кн. 2 
Модели и методы: Справочник. - 304 с.: ил. 

2. Шенк Р. Обработка концептуальной информации: Пер. сангл. Г.В. Сенина. — М.: Энергия, 1980. — 360 с.: ил. 

3. Солсо Р. Когнитивная психология. — СПб.: Питер, 2002. - 592 с.: ил. 

4. Андерсон Дж. Когнитивная психология. — 5-е изд. — СПб.: Питер, 2002. — 496 с.: ил. 

5. Виноград Терри. Программа, понимающая естественный язык: Пер. с англ. С.С. Калитина. — М.: 
Мир, 1976. - 295 с. 

6. Хофман И. Активная память. — М.: Прогресс, 1986. — 39 с. 

7. Кофман А. Введение в теорию нечетких множеств: Пер. с франц. — М.: Радио и связь, 1982. — 432 с.: ил. 


А. Парамонов 

Тнтенаональн! представлення у вигляд! нечтко! г!бридно! моделЕ знань 

Розглядаеться проблема представлення знань, що м!стяться у природно-мовних текстах. Сформульована 
проблема в загальному вигляд! 1 висунут! гитотези на основ! 1снуючо! концепцй знань. 3 урахуванням 
специф\ки людського мислення розроблена г1бридна модель представлення знань, стан яко! дозволяе 
представляти знання, виражен! фрагментом текстово! 1нформацй. На основ! модел! прототишв вирипуеться 
завдання врахування 1ндив1дуальних знань про оточення. 


А.Г. Рагатопоу 

Еи77у Нубча Моде! о? Кпощедое а$ Пиеп$1 опа! Вергезещайоп 

ТБе ргоМет оЁ Кпо\едее гергезепайоп сопаште ш паблгаПу-1апопазе {ех{5 1$ сопз1дегеа. Тве ргоМет ш а 
сепега] уе 15 Фогишайе4. Нуро®езез, оп фе Ба$15 ое ех1зб п? Кпо\е4зе сопсер аге ри ог\уаг4. Зерагайоп 
о# ех15Нп поде[$ о КпоУЛедее гергезещайоп 15 тагке4 а{ фе ргоМет 4ес1$1оп. ТБезе по4е|5 о по зоуе аП 
ргоет$ соппесе у Кпо\\едее гергезетаноп. Тве Буа тоде| оР Кпо\Ледее гергезещайоп 1$ деуеоред. 
ТБе соп4 оп оРрубй4 тоде| аПо\уз гергезепип? фе Кпо\едее ехргеззе4 Бу а {ехё шЮппайоп азтеп. Оп 
Фе Баз1$ оЁргоюбурез тоде! ве ргоМетт 1$ зо]уе ул сопзегайоп оРтаглапа| Кпо\Медэе оРап епутоптепе. 
1 ме\м оЁзрес!сйу оРБитап @шКше, фе п415йпсё Вубла плоде! оРКпо\Медее гергезещайоп 15 ойегед. 
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